有意思的是,研究者们还发现,尽管蛋白质的动力学和进化本身都涉及到非常高的自由度(组成蛋白质的成百上千个氨基酸都可以发生热涨落,也都可以在进化中发生突变),但是通过主成分分析等降维方法,可以将蛋白质的动力学和进化约化到较低的维度。在这种低维描述中,蛋白质的动力学和进化依然是高度吻合的。 这种对应关系的解释是,一方面,蛋白质天然态结构对于各种来自热噪声造成的结构改变整体表现出稳定性,然而,在蛋白质的动力学中,必须要有若干个相对敏感的运动方向,以便其发挥功能,这些特定的方向对应于蛋白质动力学中的主成分。而另一方面,面对各种突变所造成的结构改变,蛋白质的功能运动方向本身应该表现出一定的稳定性,不能因为突变造成蛋白质的功能发现巨大的改变,引发生物适应度的大幅降低 [5]。 类似的讨论还可以参考之前发表在集智公众号的文章:为什么蛋白质兼具可塑性与稳定性?从进化视角揭示生命复杂系统的内在平衡 在上述因素的影响下,蛋白质的动力学和进化都体现出鲜明的“准低维”特征,蛋白质功能运动中的构象变化被限制在低维空间,与之相应的,蛋白质的结构进化也主要被限制在这个方向上。蛋白质分子本身的模块化结构对这种低维特征有贡献。 蛋白质动力学和进化的低维特征得到了数据和理论模型的证实,这一结果更深刻地揭示了动力学和进化之间对应关系的起源。这些结果不仅有助于帮助我们理解蛋白质的功能运动和进化,而且也为蛋白质的设计提供了新的思路。不仅如此,相关的研究结果具有很强的普适性,因此对于我们研究其它生命系统(例如大脑、生物网络)乃至更一般的复杂系统也具有启发性。例如,一个人工智能系统面对着数据中的噪声,同时系统内部的连接也可以在一定的范围内发生改变,挖掘这二者之间的联系也可以对设计和训练人工智能系统提供重要的帮助。 参考文献[1] Q.-Y. Tang and K. Kaneko, Dynamics-evolution correspondence in protein structures, Phys. Rev. Lett.127, 098103 (2021)[2] Q.-Y. Tang and K. Kaneko, Long-range correlation in protein dynamics: Confirmation by structural data and normal mode analysis, PLoS Comput. Biol. 16, e1007670 (2020).[3] N. S. Keskar, D. Mudigere, J. Nocedal, M. Smelyanskiy, and P. T. P. Tang, On large-batch training for deep learning: Generalization gap and sharp minima, International Conference on Learning Representations (2017), https://openreview.net/forum?id=H1oyRlYgg[4] Z. Xie, I. Sato, and M. Sugiyama, A diffusion theory for deep learning dynamics: Stochastic gradient descent escapes from sharp minima exponentially fast, International Conference on Learning Representations (2021), https://openreview.net/forum?id=wXgk_iCiYGo[5] Q.-Y. Tang, T. S. Hatakeyama, and K. Kaneko, Functional sensitivity and mutational robustness of proteins, Phys. Rev. Research 2, 033452 (2020).